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Beschreibung 

Verfahren und Vorrichtung zur Codierung und Decodierung von 
strukturierten Dokumenten 

Die Erfindung betrifft ein Verfahren und eine Vorrichtung zur 
Codierung und . Decodierung von strukturierten Dokumenten gemaJS 
dem Oberbegriff des Anspruchs 1. 



XML (= extensible markup language) ist eine Sprache, mit der 
eine strukturierte Beschreibung der Inhalte eines Dokuments 
mittels XML-Schema-Sprachdefinitionen ermoglicht wird. Eine 
genauere Beschreibung des XML-Schemas sowie der darin verwen- 
deten Strukturen, Datentypen und Inhaltsmodelle findet sich 
in den Referenzen 

" http://w ww.w3.orq/TR/20Ql/REC-xmlscheina-0-20010502/, 

- http://www.w3.org/TR/2001/REC-xmlschema-l-20010502/, 

- http://w ww.w3.orq/TR/2001/REC-xmlschema-2-20010502/. 

4 

I 

Aus Schriften zum MPEG-7-Standard, insbesondere ISO/IEC 
15938-1 "Multimedia Content Description Interface -Part 1: 
Systems", Geneva 2002, sind Verfahren, Vorrichtungen oder 
Systeme zur Codierung bzw. Decodierung von XML-basierten Do- 
kument bekannt . 

Erweiterungen zu dem Verfahren, Vorrichtungen oder Systeme 
zur Codierung bzw. Decodierung von XML-basierten Dokument 
sind aus Schriften zum MPEG-7 -Standard, sind aus der deut- 
schen Anmeldung mit dem amtlichen Aktenzeichen 10351897.5 
bekannt. Darin ist ein Verfahren zur Codierung eines struktu- 
rierten Dokuments, insbesondere eines XML-basierten Dokuments 
offenbart, bei dem eine Vielzahl von Codes mittels eines oder 
mehrerer Schemas und/oder Namensraume erzeugt werden, wobei 
fur ein Schema und/oder einen Namensraum und/oder fiir eine 
Gruppe von Schemas und/oder NamensrSumen jeweils separate, 
von anderen Schemas und/oder Namensraumen unabhSngige Codes 
fur die mittels in den Schemas und/oder Namensraumen und/oder 
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in den Gruppen von Schemas und/oder Namensraumen definierten 
und/oder deklarierten Elemente vergeben werden. 

Diese ermeglichen eine effiziente Codierung auch dann, wenn 
Schemas dem Encoder und/oder Decoder nicht vollstandig be- 
kannt sind. Dies wird erreicht, indent Codetabellen fur die 
Datentypen, die globalen Elemente und die Ersetzungsgruppen 
nach Namensraumen getrennt werden, wobei unter einem Namens- 
raum dabei ein Raum zu verstehen ist, in dem darin verwende- 
ten Namen von Datentypen (Typnamen) mit eindeutigen Bedeutun- 
gen belegt und definiert sind. 

Bekannte Verfahren zur binaren Reprasentation von MPEG-7 und 
anderen XML-basierten Beschreibungen oder Dokumenten weisen 
Defizite hinsichtlich En- und Decodierungskomplexitat auf, 
sofern die zu codierende XML Beschreibung oder das XML Doku- 
ment auf mehreren Namensraumen beruht. Beispielsweise wird in 
den oben genannten Schriften ein Verfahren zur binSren Repra- 
sentation von XML-Beschreibungen und XML-Dokumenten beschrie- 
ben, das Codetabellen fiir XML-Beschreibungen und XML- 
Dokumente basierend auf Schemas und Namensraumen bestimmt (Im 
Folgenden wird der Ausdruck "Namensraum" synonym fiir den Aus- 
druck "Schema" verwendet) . 

Gemafi der bekannten Verf ahrensweise kOnnen dabei Datentypen 
von anderen Datentypen vererbt sein. Diese Vererbungsbezie- 
hung erlaubt, in einem XML Dokument anstatt einer Instanz des 
Basistyps eine Instanz eines vererbten Typs zu verwenden. 

Der Typecode signalisiert ausgehend vom Basistyp welchen Typs 
eine Instanz ist. Ausgehend von einem Basistypen in einem 
ersten Namensraum muss zur Bestimmung der adressierbaren Typ- 
namen in einem zweiten Namensraum bei En- und/oder Decodie- 
rung die Vererbungsstruktur uber mehrer Namensraume analy- 
siert werden. Hierzu wird ein Vererbungsbaum aufgebaut, wie 
er in der ISO/IEC 15938-1 "Multimedia Content Description In- 
terface -Part 1: Systems", Geneva 2002, beschrieben ist. 
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Dies setzt voraus, dass alle NamensrSume bekannt sind und der 
gesamte Vererbungsbaum im Speicher aufgebaut warden kann. Der 
gesamte Vererbungsbaum besteht aus den Kennzeichnern der be- 
nannten Typen aller ftlr die Instanziierung einer XML Be- 
schreibung und/oder XML Dokuments ref erenzierten Namensraume 
und deren Vererbungsbeziehung. Das beschriebene Verfahren ist 
daher sehr aufwendig. 

Die der Erfindung zugrundeliegende Aufgabe besteht nun darin, 
ein gegenUber dem aus dem Stand der Technik vereinf achtes 
Verfahren und eine Vorrichtung zur Codierung und Decodierung 
von strukturierten Dokumenten anzugeben. 

Diese Aufgabe wird ausgehend von dem Verfahren zur Codierung 
gemaJb den Merkmalen des Oberbegriffs des Anspruchs 1, ausge- 
hend von dem Verfahren zur Codierung gemSli den Merkmalen des 
Oberbegriffs des Anspruchs 2, ausgehend von dem Verfahren zum 
Decodieren gemaJi den Merkmalen des Oberbegriffs des Anspruchs 
17, sowie ausgehend von der Codiervorrichtung gemafi Anspruch 
22, der Decodiervorrichtung gemSB Anspruch 23 und der Codier- 
/Decodiervorrichtung gemaJJ dem Anspruch 24, jeweils durch de- 
ren kennzeichnenden Merkmale geldst. 



Bei dem erf indungsgemaJien Verfahren zur Codierung eines 
strukturierten, insbesondere XML-basierten Dokuments, bei dem 
eine Vielzahl von Codes mittels eines oder mehrerer Namens- 
raume erzeugt und fiir mittels Namensraumen definierten Typen 
vergeben werden, wird eine Teilmenge adressierbarer Typen ei- 
nes der NamensrSume auf Grundlage von Vererbungsbeziehungen 
zwischen den Namensraumen sowie der Namensraume der Basisty- 
pen der Teilmenge ermittelt. 

Das Verfahren zeichnet sich dadurch vorteilhaft aus, dass le- 
diglich ein geringer Teil der insgesamt vorhanden NamensrSume 
zur Identifizierung der adressierbaren Teilmenge gespeichert 
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bzw. geladen werden muss. Daher ist eine enorme Entlastung 
von Ressourcen die Folge und zudem wird das Codieren be- 
schleunigt . 

Alternativ oder erganzend wird bei dem Verfahren zur Codie- 
rung eines strukturierten, insbesondere XML-basierten, Doku- 
ments zu jedem Namensraiam eine Zuordnung zu weiteren Namens- 
rSumen derart gebildet wird, dass zumindest eine Zuordnungs- 
information dergestalt erzeugt, dass ziomindest eine Verer- 
bungsbeziehung zwischen einem erbenden Namensraum und verer- 
benden Namensraumen beschrieben ist. Hierbei wird ein Namens 
raum, der Typen enthalt, die direkt von einem Basistypen aus 
einem anderen Namensraum vererbt sind, erbender Namensraum 
genannt und ein Namensraum, der Basistypen enthalt, die in 
einen anderen Namensraum vererbt worden sind, vererbender Na 
mensraum. 



Die durch diese Weiterbildung bereitgestellten Zuordnungsin- 
formationen erm5glichen eine strukturierte Organisation von 
Vererbungsinformationen, so dass lediglich ein Teil des ge- 
samten Vererbungsbaums ftir die Identif izierung der Teilmenge 
von Noten ist. Diese Weiterbildung fiihrt somit zu einer wei- 
teren RessourceneinsparungZ-entlastung und Beschleunigung. 

Vorzugsweise wird die Zuordnungsinformation des erbenden Na- 
mensraums aus einer Liste von Codes der Basistypen von Kopf- 
typen des erbenden Namensraums, gebildet, wobei Kopf typen Ty- 
pen sind, die direkt von einem Basistyp des vererbenden Na- 
mensraums abstammen und wobei die Basistypen auch durch Kopf- 
typen gebildet werden, denen weitere Kopf typen entstammen. 

Bevorzugt wird die adressierbare Teilmenge ausgehend von ei- 
nem Startbasistyp der Basistypen des vererbenden Namensraums 
ermittelt, wobei zur Identif izierung der Teilmenge in der Re- 
gel ausgehend von dem Startbasistyp zur Ermittlung der Teil- 
menge Kopftypen im erbenden Namensraum durch die Zuordnungs- 
information identifiziert werden, die von einem Basistypen 
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aus dem vererbenden Namensraum abstammen, bei denen der 
Startbasistyp ein Basistyp in dem vererbenden Namensraum ist 

Alternativ oder erganzend wird bei dem Verfahren zur Codie- 
rung eines strukturierten, insbesondere XML-basierten, Doku- 
ments zu mindestens einem Namensraum die den erbenden Namens 
raumen zugeordnete Zuordnungsinf ormation gemeinsam mit dem 
jeweiligen Namensraum in einem die Codierung und/oder Deco- 
dierung vornehmenden ersten Gerat gespeichert wird. 

Bei einer Weiterbildung wird die den erbenden Namensraumen 
zugeordnete Zuordnungsinf ormation in einem zweiten Gerat er- 
zeugt und gemeinsam dem jeweiligen Namensraum in einem die 
Codierung und/oder Decodierung vornehmenden ersten Gerat ii- 
bermittelt . 

Das hier beschriebene Verfahren ist vorteilhaft, da nun zur 
Bestimmung der adressierbaren Datentypen nur der Namensraum 
des Basistypen, der Namensraum des zu adressierenden Daten- 
typs und die Vererbungsbeziehung BT bekannt sein und/oder ge- 
laden werden muss. 



Ein wesentlicher Vorteil des erf indungsgemaiien Verfahrens ist 
eine effiziente Bestimmung der adressierbaren Typnamen zu er- 
moglichen, ohne den gesamten Vererbungsbaum aufbauen zu miis- 
sen. Zudem kann dies auch ohne Kenntnis aller Schemas oder 
Namensraume erfolgen. 

Ein weiterer Vorteil besteht darin, dass die Suche nach dem 
adressierten Datentyp mit weniger Vergleichoperationen reali- 
siert werden kann verglichen mit der Suche im gesamten Verer- 
bungsbaum. 

In einer Aus fahrungs form besteht die Vererbungsinf ormation BT 
eines Namensraums NS aus einer Liste an Typcodes TC^^^ der Ba- 
sistypen LBT je Kopftypen HT des Namensraums NS . 
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In einer weiteren Ausfuhrungsf orm hierzu warden die Typecode 
nach folgendem Verfahren vergeben: 

Zur Codierung eines strukturierten Dokuments werden eine 
Vielzahl von Codes mittels eines oder mehrerer Schemas 
und/oder Namensraume erzeugt. Dabei werden fur ein Schema 
und/oder einen Namensraum und/oder fur eine Gruppe von Sche- 
mas und/oder Namensraumen jeweils separate, von anderen Sche 
mas und/oder Namensraiimen unabhangige Codes ftir die mittels 
in den Schemas und/oder Namensraumen und/oder in den Gruppen 
von Schemas und/oder NamensrSumen definierten und/oder dekla^ 
rierten Elemente vergeben. 

Bei Weiterbildung hiervon werden Codes in Schemas und/oder 
Namensraumen separiert vergeben. Das hier beschriebene Ver- 
fahren ist vorteilhaft, da nun Schemas und/oder NamensrSume 
nach Bedarf auch wahrend der Ubertragung von Dokumenten gela- 
den werden konnen und existierende Codetabellen fiir andere 
Namensraiime sich hierdurch nicht andern und somit nicht neu 
erstellt werden milssen. Ein weiterer Vorteil besteht darin, 
dass die separaten Codes filr Falle, in denen sehr viele Na- 
raensraume importiert werden, weniger Bits zur Adressierung 
benotigen, als wenn wie in ISO/IEC 15938-1 "Multimedia Con- 
tent Description Interface -Part 1: Systems", Geneva 2002, 
alle Namensraume zusammengef asst werden. Auch in Fallen, in 
denen ein sehr groJier Namensraum importiert wird, k6nnen die 
separaten Codes fur die anderen Namensraume mit weniger Bits 
codiert werden. 

In einer bevorzugten Variante der Erfindung sind die separa- 
ten Codes in Adressbereiche eingeteilt, wobei aber die Ad- 
ressbereiche das Schema und/oder der Namensraum bzw. die 
Gruppe von Schemas und/oder NamensrSumen identif izierbar 
wird. 

In einer bevorzugten Ausf ahrungsf orm des erf indungsgemaJien 
Codierverfahrens umfassen die separaten Codes jeweils einen 
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lokalen Code beziiglich des Schemas und/oder des Namensraums 
und/oder beztiglich der Gruppe von Schemas und/oder Namensrau- 
men und einen Identif ikationscode, der das Schema und/oder 
den Namensraum und/oder die Gruppe von Schemas und/oder Na- 
mensraumen identif iziert . Ein lokaler Code ist hierbei ein 
Code, der eindeutig innerhalb des durch den Identif ikations- 
code identif izierten Schemas bzw. Namensraums ist. 

Vorzugsweise werden separate Codes fiir globale Elemente 
und/oder SubstitutionGroups und/oder Datentypen vergeben Ei- 
ne genaue Definition fur globale Elemente, SubstitutionGroups 
und Datentypen findet sich in den XML-Schema-Def initionen, 
die m den Dokumenten - http://www.w3.org/TR/2001/REC- 
xmlschema-0-20010502/ , http://www.w3.org/TR/2001/REC- 
xmlschema-1-20010502/ und http://www.w3.org/TR/2001/REC- 
xmlschema-2-20010502/, genau erlautert sind. 

Fur Datentypen TypeCodes, die in dem Dokument ISO/IEC 15938-1 
"Multimedia Content Description Interface -Part 1: Systems" 
Geneva 2002, erlautert sind, werden separate Codes in einer' 
bevorzugten Ausftihrungsform derart erzeugt, dass innerhalb 
des Vererbungsbaums eines Namensraums der zu einem ersten Da- 
tentyp in demselben Namensraum benachbarten Datentyp einen 
Codeabstand zu dem ersten Datentyp hat, welcher der Anzahl 
der in diesem Namensraum von dem ersten Datentyp abgeleiteten 
Datentypen entspricht. Ein Datentyp ist zu einem ersten Da- 
tentyp benachbart, wenn der Datentyp vom gleichen Basisdaten- 
typ wze der erste Datentyp abgeleitet worden ist und dem Da- 
tentyp unter alien Datentypen, die von diesem Basisdatentypen 
abgeleitet worden sind, der kleinste TypeCode zugewiesen wur- 
de, der groJier als der TypeCode des ersten Datentyps ist. Bei 
dieser Ausftihrungsform werden die Codes fQr die Datentypen 
TypeCodes innerhalb des - moglicherweise disjunkten - Verer- 
bungsbaums so vergeben, dass eine vorteilhafte Nachbar- 
schaftsbeziehung in einem gegebenen Namensraum entsteht und 
erhalten bleibt, auch wenn in diesem Namensraum Unterbaume 
mit aus anderen Namensraumen abgeleiteten Typen vorkommen. 
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In einer besonders bevorzugten Ausf iihrungsf orm des erfin- 
dungsgemafien Verfahrens warden die separaten Codes innerhalb 
ernes gegebenen Namensraums gemafi einem Verfahren vergeben, 
das folgende Schritte umfasst: 

- in einem ersten Schritt werden alle Datentypen eines Na- 
mensraums, die von Datentypen anderer Namensraume vererbt 
worden sind, in der im MPEG-7 Standard definierten Reihenfol- 
ge der globalen TypeCodes der jeweiligen Basisdatentypen in 
exner Liste sortiert, wobei die Basisdatentypen die Datenty- 
pen in anderen NamensrSumen sind, von denen die sortierten 
Datentypen vererbt worden sind; 

- in einem zweiten Schritt werden jeweils diejenigen Datenty- 
pen ernes Namensraums, die von einem bestimmten Basisdatenty- 
pen eines bestimmten anderen Namensraums vererbt worden sind, 
lexikographisch sortiert; 

- in einem dritten Schritt werden alle Datentypen eines Na- 
mensraums, die nicht von einem Datentypen eines anderen Na- 
mensraums vererbt worden sind, entsprechend der im MPEG-7 
Standard definierten Reihenfolge in die bestehende Liste von 
Datentypen einsortiert; 

- in einem vierten Schritt werden die separaten Codes in der 

Reihenfolge der Liste an die Datentypen des Namensraums ver- 
geben. 

Der Vorteil dieser Ausf ahrungsf orm ist, dass der adressierte 
Datentyp, insbesondere ein TypeCode, schnell gefunden und so- 
mit decodiert werden kann. Nach den Regeln in ISO/IEC 15938-1 
"Multimedia Content Description Interface -Part 1: Systems" 
Geneva 2002, adressiert ein TypeCode einen abgeleiteten Typ 
relativ zu einem Basistypen. Also definiert der Basistyp ei- 
nen Unterbaum, in dem alle adressierbaren Datentypen vorhan- 
den sind. Sind in dem Unterbaum nun mehrere Namensraume ent- 
halten, so kann durch die vorteilhafte Nachbarschaf tsbezie- 
hung, die durch die obige Ausf iihrungsf orm der Erfindung er- 
reicht wird, in dem Namensraum ein adressierter Datentyp 
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schnell gefunden werden, da durch einen Vergleich eines ge- 
suchten Datentyps mit zwei benachbarten Datentypen im sor- 
tierten Vererbungsbaum festgestellt warden kann, ob sich der 
gesuchte Datentyp im Unterbaum des Datentypen der zwei be- 
nachbarten Datentypen mit dem kleineren binaren Code befin- 
det. Auf diese Weise kann der Suchaufwand erheblich verrin- 
gert werden. Ein weiterer Vorteil dieser Nachbarschaf tsbezie- 
hung besteht darin, dass ein Decoder bei einer Codierung der 
TypeCodes gemau ISO/IEC 15938-1 "Multimedia Content Descrip- 
tion Interface -Part 1: Systems", Geneva 2002, die Codewort- 
lange, die sich aus der Anzahl der abgeleiteten Datentypen 
bestimmt, direkt aus dem Codeabstand der benachbarten Daten- 
typen berechnen kann. 

In einer weiteren Ausf iihrungsf orm werden die lokalen Typcodes 
nach dem oben beschriebenen Verfahren vergeben, wobei in ei- 
ner Weiterbildung hiervon, der Typecode TC^«^ aus NamensraumID 
und lokalem Typcode nach dem in oben beschriebenen Verfahren 
gebildet wird. 

In einer weiteren Ausf tihrungsf orm werden die lokalen Typcodes 

nach dem oben beschriebenen Verfahren vergeben und nur Basis- 

typen des ersten Namensraums betrachtet, deren lokaler Typco- 
de 

a) grofier als der lokale Typcode des Startbasistyps OBT 
ist und 

b) kleiner als der kleinste, nachstgroiiere lokale Typcode 
eines zum Starbasistypen OBT benachbarten Typen ist. 



en 



In einer bevorzugten Ausf tihrungsf orm des erf indungsgemaii- 
Verfahrens werden die Vererbungsbeziehungen BT zwischen Na- 
mensraumen mit einem Schema und/oder Namensraum gespeichert 
und/oder tlbertragen. 

Neben dem oben beschriebenen erf indungsgemaBen Codierverf ah- 
ren betrifft die Erfindung ferner ein Decodierverf ahren, mit 
dem ein strukturiertes Dokument, insbesondere ein XML- 
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5 



basiertes Dokument decodiert wird, wobei das Verfahren derart 
ausgestaltet ist, dass ein mit dem erf indungsgemajJen Codier- 
verfahren codiertes Dokiament decodiert wird. 

In einer bevorzugten Ausgestaltung des erf indungsgemalien De- 

codierverfahrens wird hierbei zur Decodierung eines binaren 

TypeCodes - dessen Erzeugung oben beschrieben ist - die Code- 

lange des separaten Codes fiir den binSren TypeCode aus der 

Anzahl der abgeleiteten Daten bestiimt. Vorzugswe;Lse wird 

ferner in einer bevorzugten Aus fuhrungs form zur Decodierung 

eines bestimmten TypeCodes des Subbaums des Vererbungsbaums 

des Namensraums, in dem sich der. bestimmte TypeCode befindet, 

anhand der Codeabstande zwischen benachbarten Datentypen er-' 
mittelt . 



len 



Bei einer Weiterbildung wird zur Bestimmung der Basistypi 
die von einem Startbasistypen entstammen, anhand der Codeab- 
stande zwischen benachbarten Datentypen ermittelt. 

Eine weitere Alternative oder Erganzung ist gegeben, wenn bei 
dem zur Bestimmung der Anzahl an Typen in der Teilmenge aus- 
gehend von den Kopftypen anhand der Codeabstande zwischen be- 
nachbarten Kopf typen ermittelt wird. 

Neben den oben beschriebenen Verfahren betrifft die Erfindung 
ferner eine Codiervorrichtung sowie eine Decodiervorrichtung 
zur Durchfahrung der erf indungsgemafien Codier- bzw. Decodier- 
verfahrens. Ferner umfasst die Erfindung eine Codier- und ei- 
ne Decodiervorrichtung, mit der das erf indungsgemaiie Codier- 
verfahren und das erf indungsgemaBe Decodierverf ahren durch- 
ftahrbar ist. 

Ausfiihrungsbeispiele der Erfindung werden nachfolgend anhand 
der beigefugten Zeichnungen naher erlautert. 

Es zeigen: 
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Figur 1 eine Prinzipdarstellung eines Codier- und Decodier- 

systems in welchem das erf indungsgemaJie Verfahren 
zum Tragen konimt. 

Figur 2 eine Darstellung einer beispielhaf ten XML-Schema- 
Definition, in der auch Datentypen aus anderen Na- 
mensraumen importiert sowie abgeleitet werden. 

Figur 3 eine Darstellung eines Vererbungsbaums von Datenty- 
pen, einschlieJJlich der Zuordnung der lokalen Codes 
zu in den Namensraumen auftretenden Typen. 

Figur 4 eine Darstellung eines Vererbungsbaums von Datenty- 
pen, der sich uber mehrer NamensrSume erstreckt. 

Figur 5 eine Darstellung eines Vererbungsbaums inklusive 

Vererbungsinformationen zwischen Namensraumen. 



In Figur 1 ist beispielhaft ein Codier- und Decodiersystem, 
in dem das erf indungsgemafie Verfahren zum Einsatz kommt, mit 
einem Encoder ENC und einem Decoder DEC dargestellt, mit de- 
nen XML-Dokumente DOC codiert bzw. decodiert werden. Sowohl 
der Encoder als auch der Decoder verftigen beide iiber ein so- 
genanntes XML-Schema S, in dem die zur Kommunikation genutz- 
ten Elemente und Typen des XML-Dokuments deklariert und defi- 
niert sind. Aus dem Schema S werden iiber entsprechende Sche- 
ma-Compilationen SC im Encoder und Decoder Code-Tabellen CT 
erzeugt. Wenn das XML-Dokument DOC codiert wird, werden den 
Inhalten des XML-Dokuments tiber die Code-Tabellen binSre Co- 
des zugeordnet. Hierdurch wird eine BinSrdarstellung BDOC des 
Dokuments DOC erzeugt, die mithilfe der Code-Tabelle CT im 
Decoder wieder decodiert werden kann. Es konnen hierbei meh- 
rere Schemas verwendet werden, insbesondere konnen auch Sche- 
mas eingesetzt werden, welche auf einem Basisschema beruhen 
und aus einem weiteren Schema abgeleitet werden. 
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In Figur 2 ist beispielhaft ein Auszug aus einer XML-Schema- 
Definition gezeigt. Dem Fachmann sind solche XML-Schema- 
Definitionen bekannt, so dass auf den genauen Inhalt des Aus- 
zugs der Figur 2 nicht eingegangen wird. Der Auszug enthalt 
zwei Schemadefinitionen, zum einen wird im oberen Teil ein 
Schema A definiert, wie durch eine geschweifte Klammer ange- 
deutet ist, zum anderen wird im unteren Teil ein Schema X de- 
finiert, wie ebenfalls durch eine geschweifte Klammer ange- 
deutet wird. Das Schema X verwendet wiederum Datentypen, die 
aus dem Schema A importiert worden sind. 

In Figur 3 sind die Vererbungsbeziehungen zwischen einem ers- 
ten Namensraum NSl und einem zweiten Namensraum NS2 und deren 
Datentypen in der Form eines Ausschnitts einer Baumstruktur 
grafisch dargestellt. Wie der Figur anhand des rtickwarts ge- 
richteten nichtgestrichelten Pfeils entnommen werden kann, 
besteht eine Vererbungsbeziehung zwischen dem zweiten Namens- 
raum NS2 und dem ersten Namensraum NSl. Jeder Knoten in dem 
Vererbungsbaum reprasentiert einen definierten, benannten Da- 
tent yp in der Schemadef inition. Mit dem in der deut schen An- 
meldung mit dem amtlichen Aktenzeichen 10351897.5 beschriebe- 
nen Verfahren werden ftir die NamensrSume NS1..NS2 jeweils lo- 
kale Codes vergeben, die in Figur 3 durch die Zahlen links 
neben den Knoten spezifiziert sind. Diese sogenannten lokalen 
Typecodes adressieren alle Typen in einem Namensraum eindeu- 
tig. Bei der erf indungsgemaJJen Signalisierung eines Datentyps 
ausgehend von einem Startbasistyp OBT .im ersten Namensraum 
NSl ist die Menge der adressierbaren Typen im zweiten Namens- 
raum NS2 eine - durch die gestrichelte Umrandung angedeutete 
- Teilmenge TM aller Typen in dem Namensraum NS2. Dementspre- 
chend werden nur wenige Typcodes verwendet, die in Figur 3 
durch die Zahlen rechts neben den Knoten spezifiziert sind 
und die gegebenenfalls nur eine kiirzere binSrer ReprSsentati- 
on erfordern. 

In Figur 4 sind vier Namensraume NS1..NS4 dargestellt, zwi- 
schen denen auch indirekte Vererbungsbeziehungen existieren; 
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d.h. Vererbungsbeziehungen, bei denen zwischen einem abgelei 
teten Typ und einem Basistyp mindestens ein weiterer Namens- 
raum der Namensraiame NS1..NS4 liegt. 

Erfindungsgemafi lasst sich nun ausgehend von dem hervorgeho- 
ben dargestellten Startbasistyp OBT im ersten Namensraum NSl 
eine - in der Darstellung durch die gestrichelte Umrandung 
hervorgehobene- Menge TM von adressierbaren Typen durch Be- 
trachtung von Vererbungsbeziehungen aller Namensraume 
NS1..NS4 bestimmen. 

In Figur 5 sind fur den vierten Namensraum NS4 die gemaB ei- 
ner Variante des erf indungsgemSfien Verfahrens strukturierten 
Vererbungsinformationen BT1,.BT3 dargestellt. 

Zu erkennen ist dabei, dass die Strukturierung derart herbei- 
geftihrt wird, dass fur jeden Datentyp, der direkt von einem 
Datentyp aus einem anderen Namensraum vererbt ist (die jewei- 
lige direkte Vererbung ist durch jeweils einen nichtgestri- 
chelten riickwarts gerichteten Pfeil dargestellt) , die Verer- 
bungsinformationen BT1..BT3 gespeichert und/oder von einem 
ersten zu einem zweiten GerSt ubertragen werden, wobei die 
Vererbungsinformationen BT1..BT3 eines Datentypen gemafi der 
gezeigten Ausf uhrungsvariante aus einer Kennzeichnung des je- 
weiligen Namensraums NAMENSRAUM_ID und dem lokalen Typcode 
der Basistypen LET, LBT' in den jeweiligen vererbenden Na- 
mensraum NSl, NS3 sowie NS4 bestehen. 

Ausgehend von diesen strukturierten Vererbungsinformationen 
BT1..BT3 wird der Kern des erf indungsgemSJien Verfahrens deut- 
lich, der darin liegt, dass statt des gesamten Vererbungs- 
baums, der sich aus der Vereinigungsmenge der Vererbungsver- 
haltnisse aller Namensraume ergibt, lediglich die Namensraume 
von Startbasistypen OBT, der zu adressierenden Typen und die 
Vererbungsbeziehung BT1..BT3 zwischen demjenigen Namensraum 
(erbender Namensraum) , der die adressierbaren Typen enthalt, 
und demjenigen Namensraum (vererbender Namensraum), der den 
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jeweiligen Startbasistypen OBT enthalt, gespeichert und fiir 
die Bestimmung der adressierbaren Datentypen TM verwendet 
werden. 

Die Vererbungsinformation (-beziehung) BT1..BT3 identif iziert 
somit im Grunde Basistypen von Kopftypen eines Namensraums, 
wobei man unter Kopftypen diejenigen Datentypen versteht, die 
direkt auf einem Basistyp aus einem vererbenden Namensraum 
basieren und wobei als Basistypen hierbei diejenigen Datenty- 
pen LBT eines vererbenden Namensraums NSl, NS3 sowie NS4 ver- 
standen werden, die 

a) direkter Basistyp (LBT) eines Kopftypen (HT) , oder 

b) direkter Basistyp (LBT') eines Kopftypen (HT' ) eines 
etwaigen weiteren sich in der Vererbungshierarchie be- 
findenden - gemafi dem Ausf uhrungsbeispiel dritten- Na- 
mensraums NS3 sind, wobei der Kopftyp HT' direkter oder 
indirekter Basistyp des Kopftypen HT im Namensraum des 
abgeleiteten Typen ist. 

Ausgehend von dieser erf indungsgemafien Strukturierung werden 
nun bei dem erf indungsgemaBen Verfahren ausgehend von einem 
Startbasistyp OBT in einem ersten Namensraum NSl die adres- 
sierbaren Datentypen TM in einem zweiten Namensraum NS2 iden- 
tifiziert, indem 

a) Kopftypen HT in dem zweiten Namensraum identif iziert 
werden, zu denen Typen LBT und LBT' aus dem ersten Na- 
mensraum als Vererbungsinformation BT1..BT3 abgelegt 
sind, und 

b) der Typ OBT ein Basistyp der Typen LBT bzw. LBT' ist. 

Somit lasst sich lediglich zusammen mit dem Vererbungsbaum 
des erbenden Namensraums ausgehend von einem als Basistyp 
festzulegenden Datentyps des vererbenden Namensraums NSl eine 
Menge der adressierbare Typen bestimmen, ohne Kenntnis aller 
im erbenden Namensraum importierter Namensraume haben zu mus- 
sen. Hieraus ergibt sich eine enorme Aufwandsminimierung, die 
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sich in einer Einsparung von Rechenleistung und Speicher- 
platzbedarf sowie einer beschleunigten Codierung bzw. Deco 
dierung niederschlagt . 
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Patentanspruche 

1. Verfahren zur Codierung eines strukturierten, insbesondere 
XML-basierten Dokuments, bei dem eine Vielzahl von Codes mit- 
tels eines oder raehrerer Namensraiome (NS1..NS4) erzeugt und 
ftlr mittels Namensraumen (NS1..NS4) definierten Typen verge- 
ben werden 

dadurch gekennzeichnet , 

dass eine Teilmenge (TM) bestehend aus adressierbaren Typen 
eines Namensraums (NS2) ausgehend von einem Startbasistypen 
(OBT) auf Grundlage einer Vererbungsbeziehung (BT1..BT3) zwi- 
schen den Namensraumen (NS1..NS4) sowie der Vererbungsbezie- 
hungen in einem Namensraum des Basistypen (OBT) und der Ver- 
erbungsbeziehungen in dem Namensraum der Teilmenge (TM) er- 
mittelt wird. 

2. Verfahren zur Codierung eines strukturierten, insbesondere 
XML-basierten, Dokuments nach dem Oberbegriff des Anspruchs 1 
Oder nach dem Anspruch 1, 
dadurch gekennzeichnet, 

dass zu jedem Namensraum eine Zuordnung zu weiteren Namens- 
raumen derart gebildet wird, dass zumindest eine Zuordnungs- 
information (NAMENSRAUM_ID, TYPECODE) dergestalt erzeugt 
wird, dass zumindest eine Vererbungsbeziehung (BT1..BT3) zwi- 
schen einem erbenden Namensraum (NS2) und vererbenden Namens- 
raumen (NSl, NS3, NS4) beschrieben ist. 

3. Verfahren nach Anspruch 2, 
dadurch gekennzeichnet, 

dass die Zuordnungsinf ormation des erbenden Namensraums (NS2) 
aus einer Liste von Codes (TYPECODES) der Basistypen (LBT, 
LET') von Kopftypen (HT) des erbenden Namensraums gebildet 
wird, wobei Basistypen (LBT, LBT') Typen sind, von denen di- 
rekt der Kopftyp (HT) entstammt (LBT) oder von denen ein 
Kopftyp (HT') entstammt, der wiederum Basistyp eines Kopftyps 
(HT) des erbenden Raums (NS2) ist (LBT'). 
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4. Verfahren nach Anspruch 3^ 
dadurch gekennzeichnet, 

dass die adressierbare Teilmenge (TM) ausgehend von einem 
Startbasistyp (OBT) durch Bestiirimung der Basistypen (LBT, 
LBT' ) des vererbenden Namensraums (NSl) ermittelt wird. 

5. Verfahren nach Anspruch 4, 
dadurch gekennzeichnet, 

dass 

a) ausgehend von dem Startbasistyp (OBT) zur Ermittlung der 
Teilmenge (TM) Kopftypen (HT) im erbenden Namensraum (NS2) 
ermittelt werden, zu denen Basistypen (LBT, LBT' ) aus dem 
vererbenden Namensraum (NSl) durch die Zuordnungsinf orma- 
tion (NAMENSRAUM^ID, TYPECODE) identif iziert sind, 

b) der Startbasistyp (OBT) ein Basistyp der Basistypen (LBT, 
LBT') des vererbenden Namensraums (NSl) ist. 

6. Verfahren nach einem der vorhergehenden Anspruche, 
dadurch gekennzeichnet, 

dass die den erbenden Namensraumen (NS2) zugeordnete Zuord- 
nungsinformation (NAMENSRAUM_ID, TYPECODE) gemeinsam mit dem 
jeweiligen Namensraum (NS2) in einem die Codierung und/oder 
Decodierung vornehmenden ersten Gerat gespeichert wird. 

7. Verfahren nach Anspruch 6, 
dadurch gekennzeichnet, 

dass die den erbenden Namensraumen (NS2) zugeordnete Zuord- 
nungsinformation (NAMENSRAUM_ID, TYPECODE) in einem zweiten 
Gerat erzeugt und gemeinsam dem jeweiligen Namensraum (NSl 
NS2) in einem die Codierung und/oder Decodierung vornehmenden 
ersten Gerat tibermittelt wird. 

8. Verfahren nach einem der vorhergehenden Anspriiche, 
dadurch gekennzeichnet, 

dass fiir ein Schema und/oder einen Namensraum und/oder fiir 
eine Gruppe von Schemas und/oder Namensraumen jeweils separa- 
te, von anderen Schemas und/oder Namensraumen unabhangige Co- 
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des fur die mittels in den Schemas und/oder Namensraumen 
und/oder in den Gruppen von Schemas und/oder Namensraumen de 
finierten und/oder deklarierten Elemente vergeben werden. 

9. Verfahren nach Anspruch 8, bei dem zur Identif ikation des 
Schemas und/oder des Namensraums und/oder der Gruppe von 
Schemas und/oder Namensraumen die separaten Codes in entspre 
chende Adressbereiche unterteilt sind. 

10. Verfahren nach einem der Anspriiche 8 bis 9, bei dem die 
separaten Codes jeweils einen lokalen Code bezuglich des 
Schemas und/oder des Namensraums und/oder bezuglich der Grup 
pe von Schemas und/oder Namensraumen und einen Identif ikati- 
onscode zur Identif ikation des Schemas und/oder des Namens- 
raums und/oder der Gruppe von Schemas und/oder Namensraumen 
umf assen. 

11. Verfahren nach einem der Anspruche 8 bis 10, 

bei dem separate Codes ftir globale Elemente und/oder Substi- 
tutionGroups und/oder Datentypen erzeugt werden. 

12. Verfahren nach Anspruch 11, bei dem separate Codes fQr Da- 
tentypen TypeCodes derart erzeugt werden, dass innerhalb des 
Vererbungsbaums eines Namensraums, der zu einem ersten Daten- 
typ in demselben Namensraum benachbarten Datentyp einen Code- 
abstand zu dem ersten Datentyp hat, welcher der Anzahl der in 
diesem Namensraum von dem ersten Datentyp abgeleiteten Daten- 
typen entspricht. 

13. Verfahren nach einem der Anspruche 8 bis 12, bei dem die 
separaten Codes innerhalb eines gegebenen Namensraums gem^fi 
einem Verfahren vergeben werden, das folgende Schritte um- 

f asst : 

- in einem ersten Schritt werden alle Datentypen eines Na- 
mensraums, die von Datentypen anderer Namensraume vererbt 
worden sind, in der im MPEG-7 Standard definierten Reihenfol- 
ge der globalen TypeCodes der jeweiligen Basisdatentypen in 
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einer Liste sortiert, wobei die Basisdatentypen die Datenty- 
pen in anderen NamensrSumen sind, von denen die sortierten 
Datentypen vererbt worden sind; 

- in einem zweiten Schritt werden jeweils diejenigen Datenty 
pen eines Namensraums, die von einem bestimmten Basisdatenty 
pen eines bestimmten anderen Namensraums vererbt worden sind 
lexikographisch sortiert; 

- in einem dritten Schritt werden alle Datentypen eines Na- 
mensraums, die nicht von einem Datentypen eines anderen Na- 
mensraums vererbt worden sind, entsprechend der im MPEG-7 
Standard definierten Reihenfolge in die bestehende Liste von 
Datentypen einsortiert; 

- in einem vierten Schritt werden die separaten Codes in der 

Reihenfolge der Liste an die Datentypen des Namensraums ver- 
geben . 

14. Verfahren zur Decodierung eines strukturierten Dokuments, 
insbesondere eines XML-basierten Dokuments, wobei das Verfah- 
ren derart ausgestaltet ist, dass ein mit einem Verfahren ge- 
maJi einem der vorhergehenden Ansprtiche codiertes Dokument de- 
codiert wird. 

15. Verfahren nach Anspruch 14 zur Decodierung eines gemSfi 
dem Verfahren des Anspruchs 12 codierten Dokuments, bei dem 
zur Decodierung eines binaren TypeCodes aus der Anzahl der 
abgeleiteten Datentypen die Codelange der separaten Codes der 
binaren Typecodes bestimmt wird. 

16. Verfahren nach Anspruch 14 oder 15 zur Decodierung eines 
gemaJi dem Verfahren des Anspruchs 5 codierten Dokuments, bei 
dem zur Decodierung eines bestimmten Typecodes der Subbaum 
des Vererbungsbaums des Namensraums, in dem sich der bestimm- 
te Typecode befindet, anhand der Codeabstande zwischen be- 
nachbarten Datentypen ermittelt wird. 

17. Verfahren zur Decodierung eines strukturierten Dokuments, 
insbesondere eines XML-basierten Dokuments, wobei das Verfah- 
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ren derart ausgestaltet ist, dass ein mit einem Verfahren ge- 
maJi einem der vorhergehenden Anspruche codiertes Dokument de- 
codiert wird. 

18. Verfahren nach Anspruch 17 zur Decodierung eines gemSB 
dem Verfahren des Anspruchs 12 codierten Dokuments, bei deiti 
zur Decodierung eines binaren TypeCodes aus der Anzahl der 
abgeleiteten Datentypen die Codeiange der separaten Codes der 
binaren Typecodes bestiinint wird. 

19. Verfahren nach Anspruch 17 oder 18 zur Decodierung eines 
gemaJi dem Verfahren des Anspruchs 12 codierten Dokuments, bei 
dem zur Decodierung eines bestimmten Typecodes der Subbaiam 
des Vererbungsbaums des Namensraums, in dem sich der bestimm- 
te Typecode befindet, anhand der Codeabstande zwischen be- 
nachbarten Datentypen erraittelt wird, 

20. Verfahren nach Anspruch 17 bis 19 zur Decodierung eines 
gemaii dem Verfahren des Anspruchs 12 codierten Dokument s, bei 
dem zur Bestimmung der Basistypen (LBT, LBT' ) , die von einem 
Startbasistypen (OBT) entstammen, anhand der Codeabstande 
zwischen benachbarten Datentypen ermittelt wird. 

21. Verfahren nach Anspruch 17 bis 20 zur Decodierung eines 
gemaB dem Verfahren des Anspruchs 12 codierten Dokuraents, bei 

w 

dem zur Bestimmung der Anzahl an Typen in der Teilmenge TM 
ausgehend von den Kopf typen (HT) anhand der Codeabstande zwi- 
schen benachbarten Kopf typen (HT) ermittelt wird. 

22. Codiervorrichtung, welche derart ausgestaltet ist, dass 
ein Codierverfahren nach einem der Anspruche 1 bis 13 durch- 
fiihrbar ist. 

23. Decodiervorrichtung, welche derart ausgestaltet ist, dass 
ein Decodierverfahren nach einem der Anspruche 14 bis 21 
durchfuhrbar ist. 
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24. Codier- und Decodiervorrichtung umfassend eine Codiervo 
richtung nach Anspruch 22 und eine Decodiervorrichtung nach 
Anspruch 23. 
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Zusammenf assung 
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Verfahren und Vorrichtung zur Codierung und Decodierung von 
strukturierten Dokumenten 

Die Erfindung betrifft ein Verfahren zur Codierung eines 
strukturierten Dokuments, bei dem werden eine Vielzahl von 
Codes mittels eines oder mehrerer Schemas und/oder NamensrSu^ 
me erzeugt. Dabei werden ftir ein Schema und/oder einen Na- 
mensraum und/oder ftir eine Gruppe von Schemas und/oder Na- 
mensraumen jeweils separate, von anderen Schemas und/oder Na- 
mensraumen unabhangige Codes fiir die mittels in den Schemas 
und/oder NamensrSumen und/oder in den Gruppen von Schemas 
und/oder NamensrSumen definierten und/oder deklarierten Ele- 
mente vergeben. Des Weiteren betrifft die Erfindung ein hier- 
zu entsprechendes Decodierverf ahren, eine Codiereinrichtung, 
eine Decodiereinrichtung sowie Codier-/Decodiereinrichtung. 

Fig. 5 
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<schetna tar^etNaiuecp5ic«»«urTi;fii*saittitoiSche*naA»' 

3<mln» tA="u3na cuty Schema J Scb^ntaA'* 

xtAlna :xaf*>-hl:tp //www , w3 . org/2001/JCMX4Schema« 

<8«q[uence> 

^element aam6«"n*nie« type-ijffttstrina*'/^ 
^element ttamc^'valtie" type^^x^t integer*/ > 

</ ccmp'lexType> 

</»eq«e^«r°°' string-/* 

</txtnnalon.> 
</cc3roplexContexit > 
</ octtipl«x7ype> 

<cocnpXe»i<ype n«iie»«cftySecondType »* ? 
«:«ntpl«xContent> 

<Beqttence> ' 

</ sequencer ' 
</ extenfiioii> 
</cc»»p!lexCont«»t> 
</conipl exT3^e:> 
<./&chem4iL> 

xmlns ; "urn j mySchema ; Sch«matX » 
JKmLn&;xs«r<'hjei:pE//ww«r. w3 .org/SOOl/xHLSckema'* 

<awport tiAm^space^-uirtt: i«ySct«sma:ScheiaatA« ScttftmaLocations." /Tre«Ex^m«i* ^ 

<seguenc&> 

^element 4sam6^«*iiame» type* "x© t string*/* 
</oequei»ce>™^*' natn«*'*vaXue»« typB«*x«»Anteger-/> 
</ complaxSCypsi^ 

<cotr!pa«xCont:Qnt > 

</ttXt«nHion> 

</completcCont«nt> 

< / cc<nplexrype> 

<coinpl6Xrype ii»m«»»»»oTyp««> 
<ccmiplexcotttent> 

<exfcen«ion 3c>ase«^*<«$ii|odeX''> 
<eequence> 

<el€TOenfc naTOe»«'id" typtt«*xsilD»'/> 
</aei3uence> 
</exten8ic3(n> 
<; /cowpaexContcnt* 

< / coTOpleacTypo 

ccomplexType naTne»**nType«> 
<coinpleoccontenc> 

<exteoaxon ba9e»*'x:BType**> 
<sequence> 

<«I«tnent nawa* "price" type=:'«x»;float«/i. 

-:/*xten8ion> 
< / cowplexContent^ 
</ccxnplexType> 
</scheitia> 
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